DOCUMENTO EXPLICATIVO DE LAS VARIABLES CONTENIDAS EN LA 
BASE DE DATOS 


La generación de tres bases de datos, una para cada cantón de estudio, tiene como finalidad 
colectar información de variables relacionadas con el inicio de incendios forestales (momento de 
ignición), cuya inclusión en este proyecto surge de una revisión de literatura científica previa. 


Estas bases de datos son el primer paso para generar los modelos de susceptibilidad de 
incendios forestales, que nos permiten identificar zonas con una probabilidad de ocurrencia 
mayor y que, por tanto, necesitan una atención prioritaria en la prevención de estos desastres. 


Este documento surge en colaboración con tres estudiantes del componente práctico Gestión 
Productiva 3.1. de la titulación de Gestión Ambiental, y pretende dar una breve explicación del 
proceso de obtención de las 23 variables que conforman las bases de datos anteriormente 
mencionadas. En función de ello, esta guía se subdivide en tres secciones: variables 
topológicas, variables de interacción antrópica y variables del estado de la vegetación. 


Puede acceder a las bases de datos en el siguiente enlace. 


VARIABLES TOPOGRÁFICAS (https://bit.ly/3HTPxjx) 


Variable Descripción Proceso de obtención Metadatos de la capa 
Se importa un archivo .kml con los 
límites del cantón de interés y se SRC: EPSG:32717 
realiza la búsqueda de Modelos de 
Elevación Digital (DEM) disponibles en | Resolución espacial: 12.5 x 
la web de ALOS PALSAR para la 12.5 metros 
zona. 
Generadores: 
кз Altur re el ; Joel Guillén 
1 Elevación tu а sobre е Una vez descargados los archivos en | Julia Loján 
nivel del mar. high resolution se utiliza la Néstor Merino 
herramienta de QGIS para combinar | Esteban Proaño 
las teselas (Ráster > Miscelánea > 
Combinar), posteriormente se recorta | Rango de valores: 
alos límites de nuestra zona de 0 - 3668 
interés (Ráster > Extracción > Cortar Unidades: 
ráster por capa de máscara) пасе Шз: 
SRC: EPSG:32717 
АІ DEM obtenido en la web de ALOS Resolución espacial: 12.5 x 
Grado de PALSAR, se le aplica un filtro de 12.5 metros 
inclinación del suavizado en QGIS herramienta р 
SAGA (Simple Filter, Smooth 3). Generadores: 
; terreno, puede Joel Guillén 
2 | Pendiente ; Julia Lojá 
medirse en А ' z ulia Loján 
Después de aplicar el filtro de Néstor Merino 
rados o А ih Р Д 
9 А suavizado, se utiliza la herramienta Esteban Proafio 
porcentaje. GRASS (r.slope.aspect, percent) 
Rango de valores: 
0— 375 
Unidades: porcentaje (96) 
: x RC: EPSG:32717 
Dirección de SHG: EPSG 
a tales AI DEM obtenido en la web de ALOS | Resolución espacial: 12.5 х 
escendente PALSAR, se le aplica un filtro de | 
que presenta suavizado en QGIS herramienta Generadores: 
| б cada celda, SAGA (Simple Filter, Smooth 3). Joel Guillén 
3 Orientación tomando como Julia Loján 
referencia los Después de aplicar el filtro de Néstor Merino 
puntos suavizado, se utiliza la herramienta | Esteban Proaño 
cardinales GRASS (r.slope.aspect) Rango de valores: 
(Norte, Sur, 0 – 360 
Este, Oeste) Unidades: grados (°) 


VARIABLES DE INTERACCIÓN ANTRÓPICA (https://bit.Iy/3HTPxjx) 


La generación de las capas de accesibilidad surge a partir de una capa de superficie de fricción, 
que contiene el costo añadido que implica la movilización desde cada punto del territorio hasta 
el punto(s) objetivo(s), la siguiente gráfica pretende ilustrar el proceso seguido para su cálculo. 


Obtenido en Mapa Interactivo Ambiental 
(btrp://ide.ambiente.gob.ec/ 
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Generado en SAGA, apartir del DEM 
ALOS PALSAR 
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Reyes, F. (2017). Mapa de Accesibilidad Territorial. En Manual de Prácticas de Ordenación Territorial (págs. 29-41). 


Loja: UTPL. 
Variable Descripción Proceso de obtención | Metadatos de la capa 
SRC: EPSG:32717 
Facilidad d Resolución espacial: 10 x 10 
aciliaad ae к : metros 
—- movimiento desde Utilizando la herramienta Generadores: 
Accesibilidad cualquier punto GRASS r.cost.full, se configura | Joel Guillén 
4 al centro del cantón hasta como punto(s) objetivo(s) la Julia Loján 
económico capa de centro económico Néstor Merino 
el centro descargada en el portal del SNI, | Esteban Proaño 
económico. Rango de valores: 
0 — 343 
Unidades: minutos 
Utilizando la herramienta 
GRASS r.cost.full, se configura 
como punto(s) objetivo(s) la dpi usd 7 T" 
к capa de áreas protegidas esolución espacial: 10 x 
"me Facilidad de descargada en el Mapa metros | 
Accesibilidad | movimiento desde | ИЧУУ Generadores; 
Б А nteractivo Ambiental. Joel Guillén 
5 a áreas cualquier punto Julia Loján 
protegidas del cantón hasta Las categorías consideradas de | Néstor Merino 
áreas protegidas. áreas protegidas son: Esteban Proaño 
Sistema Nacional de Áreas Protegidas Rango de valores: 
Bosque y Vegetación Protectora 0-271 
Area Bajo Conservación i cm 
Patrimonio Forestal del Estado Unidades: minutos 
Areas de Protección Hídrica 


SRC: EPSG:32717 
Resolución espacial: 10 x 10 


NS Facilidad de Utilizando la herramienta e NE: 
Accesibilidad movimiento desde | GRASS r.cost.full, se configura | Joel Guillén 
6 a zonas cualquier punto como punto(s) objetivo(s) la Julia Loján 
pobladas del cantón hasta capa de poblados descargada DE Merina 
en el portal del SNI. steban Proaño 
poblados. P —: Rango de valores: 
0 — 365 
Unidades: minutos 
SRC: EPSG:32717 
Resolución espacial: 10 x 10 
Facilidad de eR а е Ее 
т movimiento desde r.cost.full, se configura Шеп 
7 | Accesibilidad cualquier punto сото punto(s) objetivo(s) la TA 
a vías : capa de vías descargada en el A Jan 
del cantón hasta | del SNI li Néstor Merino 
vías portal del SNI y actualizada Esteban Proaño 
. manualmente. Rango de valores: 
0 — 360 
Unidades: minutos 
SRC: EPSG:32717 
Facilidad de Utilizando la herramienta A 
— movimiento desde | GRASS r.cost.full, se configura | Generadores: 
Accesibilidad cualquier punto como punto(s) objetivo(s) la Joel Guillén 
8 a zonas del cantón hasta capa de cobertura vegetal Julia Loján 
antrópicas zonas pobladas o descargada en el Mapa bia Morin 
Interactivo Ambiental. steban Froano 
zonas А Rango de valores: 
agropecuarias. 0- 262 
Unidades: minutos 
SRC: EPSG:32717 
Resolución espacial: 10 x 10 
А | Utilizando la herramienta metros 
Distancia | | GRASS r.grow.distance, se Generadores: 
desde el Distancia desde el configura como punto(s) podra 
9 bium us Julia Loján 
centro centro económico. objetivo(s) la capa de centro Néstor Merino 
económico económico descargada en el Esteban Ргоайо 
portal del SNI. Rango de valores: 
0 — 4173 
Unidades: metros 
SRC: EPSG:32717 
Resolución espacial: 10 x 10 
NT . metros 
Utilizando la herramienta Generadores: 
; А А ; GRASS r.grow.distance, se Joel Guillén 
istancia Distancia desde : 
10 desde rí HOS configura como punto(s) Julia Loján 
esae rios i objetivo(s) la capa ríos generada | Néstor Merino 
a partir del DEM. Esteban Proaño 
Rango de valores: 
0-4173 
Unidades: metros 
SRC: EPSG:32717 
Resolución espacial: 10 x 10 
Utilizando la herramienta metros 
| | | | GRASS r.grow.distance, se | Generadores: 
11 Distancia Distancia desde configura como punto(s) КОЛА 
desde vías vías. objetivo(s) la capa vías Naci Mens 
descargada en el portal del SNI | Esteban Proaño 
y actualizada manualmente. Rango de valores: 
0- 14253 
Unidades: metros 
Utilizando la herramienta SRC: EPSG:32717 
Di . GRASS r.grow.distance, se Resolución espacial: 10 x 10 
istancia f ' fi t metros 
А Distanci configura como pun o(s) . 
12 | desde áreas pde desde objetivo(s) la capa áreas Generadores; 
i áreas protegidas : p Joel Guillén 
protegidas protegidas descargada en el Julia Loján 


Mapa Interactivo Ambiental. 


Néstor Merino 
Esteban Proaño 


Las categorías consideradas de 


áreas protegidas son: 
Sistema Nacional de Áreas Protegidas 
Bosque y Vegetación Protectora 
Area Bajo Conservación 
Patrimonio Forestal del Estado 
Areas de Protección Hídrica 


Rango de valores: 
0 — 15047 
Unidades: metros 
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Distancia a 
Sonas zonas pobladas o 
ade zonas 
antropicas agropecuarias. 


Distancia desde 


Utilizando la herramienta 
GRASS r.grow.distance, se 
configura como punto(s) 
objetivo(s) la capa zonas 


pobladas o zonas 
agropecuarias. 


SRC: EPSG:32717 
Resolución espacial: 10 x 10 
metros 
Generadores: 

Joel Guillén 

Julia Loján 

Néstor Merino 
Esteban Proaño 
Rango de valores: 
0 — 661 

Unidades: metros 


VARIABLES DEL ESTADO DE VEGETACIÓN 
(htips://terabox.com/s/1WiFtvbjo NW Vli1gYILWIA Password:t5kq) 


: S Proceso de 
Variable Descripción A Metadatos de la capa 
р obtención р 
Atmospherically Resistant 
Vegetation Index 
NDVI corregido para efectos de SRC: EPSG:32717 
dispersión atmosférica 
P Resolución espacial: 10 x 10 
14 ARVI metros 
mm NIR — (2 * Red) + Blue 
© NIR + (2 * Red) + Blue Rango de valores: -1 a 1 
NIR (Near-Infrared Region) > B8 
Red (Rojo, espectro visible) > B11 
Blue (Azul, espectro visible) > B2 
Bare Soil Index 
Identificar zonas sin cobertura vegetal SRC: EPSG:32717 
15 BSI psi (Red + SWIR) — (NIR + Blue) Los índices Resolución espacial: 10 x 10 
(Red + SWIR) + (NIR + Blue) espectrales o metros 
índices de Rango de valores: -1 a 1 
Red (Rojo, espectro visible) > B11 vegetación son 9 ` 
SWIR (Shortwave Infrared) > B4 
NIR (Near-Infrared Region) 2 B8 descargados 
Blue (Azul, espectro visible) > B2 mediante el 
. | siguiente script de 
Green Normalized Difference Google Earth 
Vegetation Index Engine, se usa para 
Versión del NDVI más sensible a la ello imágenes SRC: EPSG:32717 
variación del contenido de clorofila y Senti 
Meo А entinel 2А. ió sal: 
16 GNDVI nitrógeno en el cultivo Resolución espacial: 10 x 10 
metros 
GNDVI — NIR=SWIR Rango de valores: -1 a 1 
NIR + SWIR 
SWIR (Shortwave Infrared) > B3 
NIR (Near-Infrared Region) > B8 
Moisture Stress Index 
Determinar el estrés hídrico de la SRC: EPSG:32717 
vegetación Resoliició ial: 10 x 10 
esolución espacial: 10 x 
17 MSI MidIR metros 
MSI = ——— 
NIR Rango de valores: 0 a 3+ 
MidIR (Shortwave Infrared) > B11 
NIR (Near-Infrared Region) > B8 
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NBR 


Normalized Burn Ratio 
Estimar la cantidad y desarrollo de 
áreas incendiadas 


NIR — SWIR 


NBR = nnr 
NIR + SWIR 


SWIR (Shortwave Infrared) > B12 
NIR (Near-Infrared Region) > B8 


SRC: EPSG:32717 


Resolución espacial: 10 x 10 
metros 


Rango de valores: -1 a 1 
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NDMI 


Normalized Difference Moisture 
Index 
Determinar el contenido de agua de la 


vegetación 
NIR — SWIR 


NDMI = = 
МЕ + SWIR 


SWIR (Shortwave Infrared) > B11 
NIR (Near-Infrared Region) B8 


SRC: EPSG:32717 


Resolución espacial: 10 x 10 
metros 


Rango de valores: -1 a 1 
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NDWI 


Normalized Difference Water 
Index 
Identificar masas de agua y zonas de 


elevada humedad 
NIR — Green 


NDWI = —— — —— 
МЕ + Greem 


SWIR (Shortwave Infrared) > B3 
NIR (Near-Infrared Region) B8 


SRC: EPSG:32717 


Resolución espacial: 10 x 10 
metros 


Rango de valores: -1 a 1 
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NDVI 


Normalized Difference 
Vegetation Index 
Facilidad con la que el fuego se 
propaga en la vegetación 


NIR — Red 


NBR = ———— 
NIR + Red 


Red (Rojo, espectro visible) > B4 
NIR (Near-Infrared Region) > B8 


SRC: EPSG:32717 


Resolución espacial: 10 x 10 
metros 


Rango de valores: -1 a 1 
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SAVI 


Soil Adjusted Vegetation Index 
Analizar la vegetación en etapas de 
crecimiento inicial o dispersa 


ner- ESO ayn 
= * 
мкв)‘ +0 


NIR (Near-Infrared Region) > B8 
R (Rojo, espectro visible) > B4 
Factor de correción de la luminosidad del suelo 


SRC: EPSG:32717 


Resolución espacial: 10 x 10 
metros 


Rango de valores: -1 a 1+ 
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Moisture 
Index 


Normalized Difference Moisture 
Index 
Estimar el contenido de humedad de 


la vegetación 
NIR — SWIR 


Moisture = —— — 
Оте = WIR + SWIR 


SWIR (Shortwave Infrared) > B11 
NIR (Near-Infrared Region) > B8A 


SRC: EPSG:32717 


Resolución espacial: 10 x 10 
metros 


Rango de valores: -1 a 1+ 
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DOCUMENTO EXPLICATIVO DEL PROCESO DE GENERACIÓN DE LA BASE 


DE DATOS 


Una vez culminada la actividad 1 dentro del objetivo específico 1 que correspondía a la 
identificación y espacialización de las variables, se dio paso a la generación de las tres bases de 
datos. En este proceso se utiliza el software libre QGIS v.3.22. con su complemento Point Sampling 
Tool, el que permite capturar valores de capas ráster o vectoriales que le corresponden a los puntos 
de muestreo (puntos de ocurrencia y no ocurrencia mencionados en la evidencia 1). 


De las 23 variables contenidas en las bases de datos, 13 tienen un carácter permanente y 10 son 
actualizables (disponibilidad de imágenes Sentinel 2A cada 5 días), por lo que el tratamiento de estos 
datos es distinto. Para ilustrar mejor este proceso se puede consultar el siguiente diagrama de flujo: 


formato ráster (TIFF) 


10 capas de índices de vegetación 
(actualizable) 


formato ráster (TIFF) formato ráster (TIFF) formato ráster (TIFF) 


, Seleccionar por expresión (fecha) y 
5 capas de distancia 5 capas de accesibilidad 3 capas de topografia actualizar tabla de datos (solo objetos 
seleccionados) 


formato vectorial (.shp) 


а] сара de puntos de muestreo 


( Extraer valores con Point Sampling Tool 


р E Е 


2 Exportar base de datos a formato Base de datos en 
| Base de datos en formato vectorial (.shp) delimitado por comas formato .csv 


capas de entrada de carácter [m capas de entrada de carácter 
permanente actualizable 


DOCUMENTO EXPLICATIVO DEL PROCESO DE GENERACIÓN DE LOS 


MODELOS DE SUSCEPTIBILIDAD 


A partir de las bases de datos generadas en la actividad 2 se inicia el proceso de generación y 
validación de modelos de aprendizaje automático o machine learning, en este caso aplicados a la 
identificación de zonas susceptibles a incendios forestales, la metodología seguida se describe en 
la siguiente gráfica: 


APRENDIZAJE AUTOMÁTICO 
Es una rama de la inteligencia los sistemas pueden aprender de datos, 
artificial (IA) identificar patrones y tomar decisiones con 
mínima intervención humana 
ems EEE 
Recolectar data 


¿qué se desea hacer? | Reunir datos de fuentes Limpiar y dar formato 


Problema a resolver confiables 


Entrenar el Validar el modelo 
modelo 
Técnicas de aprendizaje: Evaluar los resultados Ingresar nuevos 


Correr el algoritmo 
Supervisado 9 con los datos restantes datos en el modelo 


con el 75% de 
i 25% 
No supervisado datos disponibles (25%) 


l ' Árboles de decisión. 
2.Clasificación de Naive Bayes. 5.Support Vector Machines (SVM). 


3.Regresión por mínimos cuadrados. 6.Métodos "Ensemble" (Conjuntos de 
4.Regresión Logística. clasificadores). 


Proceso de Machine Learning 


Ejemplos de técnicas de aprendizaje automático 


La actividad 3 se ubica entre las etapas 3 y 4 del proceso de machine learning. La etapa 1 se 
abordó en la actividad 1 mientras se identificaban las variables a utilizarse y las etapas 2 y 3 se 
desarrollaron en la actividad 2 con la herramienta Point Sampling Tool de QGIS. Las siguientes 
etapas (5, 6, 7) suceden en las actividades 4 y 5. 


La generación de los tres modelos de susceptibilidad (uno para cada cantón) siguió el proceso que 
se explica en la figura final de este documento. Se realiza una partición de las bases de datos en 
dos grupos: 75% para entrenar el modelo y 25% para validarlo según su desempeño en las métricas 
de evaluación. Para los tres cantones se probaron tres algoritmos: árboles de decisión logística 
(LMT), regresión logística (LR) y splines de regresión adaptativa multivariadas (MARS). 


Ejemplo de la comparación de los tres algoritmos (cantón Catamayo) 


RECOPILACIÓN DE DATOS Y PREPROCESAMIENTO 
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sensor PALSAR лез агора ' p 21. NDWI 
22. SAVI 
| Datos de | Datos de resolución: 125 m 23. moisture 
validación entrenamiento 
(25%) (75%) capas base: 


IGM 
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resolución: 10 m 
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Incendios 
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E) Fuente de descarga y Obtenido en Google Earth Engine O Procesos [B] Algoritmos en QGIS 
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MODELOS DE SUSCEPTIBILIDAD A INCENDIOS FORESTALES GENERADOS PARA EL CANTÓN QUILANGA 
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MODELOS DE SUSCEPTIBILIDAD A INCENDIOS FORESTALES GENERADOS PARA EL CANTÓN GONZANAMÁ 


9540000 9550000 9560000 9570000 9580000 


9530000 


Algoritmo LMT Algoritmo LR 


"Susceptibilidad a IF ue Susceptibilidad a IF 
B Muy Baja B Muy Baja 


Baja Baja 
Media Media 


ш Alta Alta 
+ 
Muy Alta т Muy Alta 


MODELOS DE SUSCEPTIBILIDAD A INCENDIOS FORESTALES GENERADOS PARA EL CANTÓN CATAMAYO 


Algoritmo MARS 


Susceptibilidad a IF 
[i] Muy Baja 
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REPORTE DEL PROCESO DE VALIDACIÓN DE LOS MODELOS DE 


SUSCEPTIBILIDAD 


Como se ha mencionado en los documentos de evidencias previas, a esta ültima actividad dentro 
del objetivo 1 del proyecto le corresponden las etapas 6 y 7 del proceso de aprendizaje automático. 
En estas instancias, se evalüan los resultados con los datos de validación (2596 del conjunto de 
datos total) y, si las métricas son buenas, se procede a la predicción con nuevos datos. 


Para los tres cantones se probaron tres algoritmos de aprendizaje automático en el software Н: 
árboles de decisión logística (LMT), regresión logística (LR) y splines de regresión adaptativa 
multivariadas (MARS). Independientemente, de la técnica o algoritmo empleado, estos fueron 
evaluados con dos herramientas: el Área Bajo la Curva (AUC) y el Coeficiente Kappa de Cohen. 


1.1.1. Área Bajo la Curva 

La curva ROC (Receiver Operating Characteristive) permite evaluar la capacidad del 
modelo entrenado para clasificar información. Este mide la relación entre la sensibilidad 
o "tasa de verdaderos positivos" y la 1-especificidad o "tasa de falsos positivos" (Fórmula 


1 y 2). 
Sensibilidad = —. — ; VP = verdaderos positivos FN — falsos negativos (1) 
(УР+ЕМ) 
Especificidad = тол ;VN = verdaderos negativos ЕР = falsos positivos (2) 


Así, el área que se encuentre bajo esta curva representa el porcentaje de clasificaciones 
correctas. Generalmente, los valores superiores a 0.70 son considerados como buenos 
predictores (Cerda et al., 2012). 

EI AUC para los modelos entrenados en cada cantón luego de aplicar validación cruzada 
con grupos iterativos fue superior a 0.85; lo que significa que el modelo tiene un 85% de 
probabilidad para distinguir correctamente entre la posibilidad y la no-posibilidad de 
ocurrencia de un incendio. 


1.1.2. Coeficiente Kappa de Cohen 

El coeficiente Kappa o índice Kappa es un instrumento estadístico que estima la 
concordancia entre dos observadores o herramientas de medición para un mismo 
fenómeno, con el propósito de ajustar el efecto del azar en la proporción de la 
concordancia esperada, tal como establece la fórmula 3 (Landa et al., 2014). 


Карра = 20 ; (3) 


1-Ре 
Р, = proporción de concordancia observada 


P, = proporción de concordancia esperada por el azar 


Para evaluar la concordancia de variables categóricas, especialmente aquellas con 
salida dicotómica o binaria (como en el presente estudio), Landis y Koch proponen la 
interpretación cualitativa más conocida. En ella, los valores menores a 0.40 representan 
una concordancia pobre o débil; entre 0.41 a 0.6, moderada; entre 0.61 a 0.8, 
concordancia buena o significante y aquellos valores mayores a 0.80 tienen un nivel de 
conformidad casi perfecto. 

En los modelos probados para estos cantones el valor del índice Kappa rodea el 0.82. 
Siguiendo la línea explicativa anterior, se puede deducir que la conformidad entre la 
variable dependiente (ocurrencia) de la base de datos y las predicciones del modelo es 
casi perfecta. 
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